Description de la base de données

Les variables

Cette base de données provient d’une étude menée en 2013 en Slovaquie par des étudiants en statistiques auprès de leurs proches.
Les questions concernent un certain nombre de préférences comme les goûts musicaux, cinématographiques, ou encore des choses comme les traits de personnalités, les phobies, et bien sûr les caractéristiques démographiques des répondants.

La base de données est composée de 150 variables et contient 1010 observations.

Nous allons nous concentrer sur les préférences musicales, et sur les caractéristiques démographiques. Nous omettrons donc le reste des variables.

Les variables présentes concernant la musique dans cette base sont :

  • J’apprécie la musique : De 1 à 5
  • Je préfère : Rythme lent à Rythme rapide (1 à 5)
  • Dance, Disco, Funk : De 1 à 5
  • Musique Folk : De 1 à 5
  • Musique Country : De 1 à 5
  • Musique Classique: De 1 à 5
  • Musique Instrumentale: De 1 à 5
  • Pop: De 1 à 5
  • Rock: De 1 à 5
  • Metal, Hard Rock : De 1 à 5
  • Punk : De 1 à 5
  • Hip-Hop, Rap : De 1 à 5
  • Reggae, Ska : De 1 à 5
  • Swing, Jazz : De 1 à 5
  • Rock’n’Roll : De 1 à 5
  • Musique Alternative : De 1 à 5
  • Musique Latine : De 1 à 5
  • Techno, Trance : De 1 à 5
  • Opéra : De 1 à 5
  • Âge
  • Taille
  • Poids
  • Nombre de frères et soeurs
  • Genre
  • Droitier ou gaucher
  • Niveau d’éducation/diplôme
  • Enfant unique
  • Enfance en ville ou village
  • Enfance en maison ou appartement

Voici l’aperçu des différentes variables qui composent la base de données et des valeurs qu’elles prennent.

Musique Rythme Dance Folk Country Classique Instrumental Pop Rock Metal_Hardrock Punk Hiphop_Rap Reggea_Ska Swing_Jazz Rock_n_Roll Alternative Latino Techno_Trance Opera Age Taille Poids Frere_Soeurs Genre Droitier_Gaucher Education Enfant_unique Village_Ville Maison_Appartement
5 3 2 1 2 2 1 5 5 1 1 1 1 1 3 1 1 1 1 20 163 48 1 Femme Droitier Licence Non Village Appartement
4 4 2 1 1 1 2 3 5 4 4 1 3 1 4 4 2 1 1 19 163 58 2 Femme Droitier Licence Non Ville Appartement
5 5 2 2 3 4 5 3 5 3 4 1 4 3 5 5 5 1 3 20 176 67 2 Femme Droitier Collège/Lycée Non Ville Appartement
5 3 2 1 1 1 1 2 2 1 4 2 2 1 2 5 1 2 1 22 172 59 1 Femme Droitier Licence Oui Ville Maison
5 3 4 3 2 4 3 5 3 1 2 5 3 2 1 2 4 2 2 20 170 59 1 Femme Droitier Collège/Lycée Non Village Maison
5 3 2 3 2 3 3 2 5 5 3 4 3 4 4 5 3 1 3 20 186 77 1 Homme Droitier Collège/Lycée Non Ville Appartement

On vérifie le nombre de données manquantes dans la base de données, on remarque qu’il y en a beaucoup. Comme on peut le voir ici, il y a 168 données manquantes, de plus certaines cellules sont vides, on les recode en NA. Leur nombre étant important, il sera peut-être nécessaire de les supprimer pour l’étude descriptive.

On récupère alors 890 sur 1010 observations.

Statistiques descriptives

Valeurs statistiques

La plupart de nos variables sont codées de 1 à 5, il ne serait pas pertinent de chercher toutes les statistiques pour celles-ci. Les moyennes et écarts-types nous suffiront. Ce ne sera pas le cas pour certaines variables démographiques

Musique Rythme Dance Folk Country Classique Instrumental Pop Rock Metal_Hardrock Punk Hiphop_Rap Reggea_Ska Swing_Jazz Rock_n_Roll Alternative Latino Techno_Trance Opera
Median :5.000 Median :3.00 Median :3.000 Median :2.000 Median :2.000 Median :3.000 Median :3.000 Median :4.000 Median :4.00 Median :2.000 Median :2.000 Median :3.000 Median :3.000 Median :3.000 Median :3.000 Median :3.000 Median :3.000 Median :2.00 Median :2.000
Mean :4.733 Mean :3.32 Mean :3.103 Mean :2.288 Mean :2.126 Mean :2.965 Mean :2.774 Mean :3.478 Mean :3.76 Mean :2.357 Mean :2.437 Mean :2.904 Mean :2.769 Mean :2.773 Mean :3.149 Mean :2.837 Mean :2.858 Mean :2.33 Mean :2.167

Ce premier tableau montre les moyennes et les médianes pour les variables codées de 1 à 5 et correspondant aux préférences musicales des répondants.

Graphiques de répartition des répondants

Quelques graphiques concernant les répartitions de la population en terme démographiques. Même si certaines variables ne seraient pas pertinentes concernant la musique, il est important d’observer la répartition des répondants.

Ces trois premiers graphiques concernent l’âge, le poids et la taille. Concernant le poids, une valeur extrême de 150kg que nous avons choisi de ne pas représenter aussi pour une question d’échelle. Pour l’âge, on observe une majorité de jeunes entre 18/22 ans.

Ces deux graphiques concernent les répartitions en genre des répondants et de leur manualité. Concernant cette dernière, la répartition semblent assez proche de la réalité avec une minorité de gaucher. Pour les genres, l’égalité n’est pas parfaitement respectée, mais cela ne devrait par être gênant pour la suite de l’étude.

Ici, on peut observer les conditions d’enfance du répondants et son degré d’éducation lors de l’enquête. Une majorité ont grandi en ville, expliquant aussi la majorité concernant les appartements, les deux étant probablement corrélés.
Pour l’éducation, une majorité sont au collège/lycée, on observait cependant deux valeurs similaires Primaire et Actuellement en primaire que nous avons donc unifiées.

Enfin, concernant le milieu fraternel des répondants, on observe une majorité avec des frères ou sœurs. La répartition du nombre lui est assez proche de la réalité, on peut l’approximer par une loi normale de par le nombre d’observations.
Il est important de noter que certains enfant unique ont répondu avoir des frères et sœurs dans les nombres, et inversement. On peut soit les omettre de la base données, soit considérer que ce sont des demi-frères ou demi-sœurs et les garder. C’est cette dernière option que nous avons choisie.

Graphiques de répatition des réponses à l’enquête

Généralités

Ces deux premiers graphiques montrent le goût pour la musique et pour le rythme de 1 à 5.
Pour la musique, les valeurs correspondent à un degré d’appréciation. Quant au rythme, 1 signifie lent et 5 rapide. Ainsi, on observe qu’une très large majorité des répondants apprécie la musique fortement, et qu’une petite partie l’apprécie de façon plus modérée. Très peu n’aiment pas ça : 19 répondants.
Pour le rythme c’est différent, une majorité répond 3, que l’on peut interpréter comme un rythme d’environ 100 à 120 bpm ce qui regroupe une grande majorité des musiques et des styles.

Musiques modernes

On a choisi ici le terme musiques modernes de par le caractère électronique et récent des styles cités. Les répartitions ne dégage rien de particulier, exceptée pour la Techno/Trance qui est un style de musique particulier avec des rythmes rapides pouvant expliqués la majorité de 1.

Musiques standards

Pour les musiques standards, nous avons sélectionné des styles de musiques connus par tous.
Comme on aurait pu l’imaginer, la folk et la country n’ont pas l’air de rencontrer un franc succès auprès des jeunes. En revanche, le rock lui est assez apprécié.
Pour le classique et le rock’n’roll, les répartitions sont similaires, et semblent dégager une préférence neutre de par la majorité de 3.

Musiques plus rares

On parle ici de styles un peu plus rares, plus “nichés”, en particulier auprès d’une population de jeunes personnes. Cela est renforcé par les graphiques.
Pour l’opéra, le punk et le métal, la valeur 1 est majoritaire, montrant une non-appréciation majeure de ces styles.
Pour la musique latine, le jazz et le reggae, les avis sont plus neutres et même équilibrés concernant la musique latine.

Les corrélations

Ils semblent important de montrer si quelques corrélations existent entre les styles de musique, et peut-être aussi avec certaines variables démographiques.

Ce graphique permet d’observer un certains nombres de choses intéressantes, et ne sont affichés dans ce graphiques que les corrélations dont la p-value est inférieure au seuil de 0.05. On voit plusieurs corrélations au moins supérieur à 0.5 ou plus.
Par exemple, entre classique et opéra, le coefficient est de 0.6, cela paraît en effet logique, les deux styles étant assez proches.
Il en est de même pour le punk et le métal, avec un coefficient de 0.54, même si celui-ci est peu plus faible.
On observe aussi quelques coefficients négatifs, comme entre la pop et le métal.

ACP

Nous allons construire une ACP à partir des données recueillies sur les différents styles de musiques. L’analyse par composantes principales permet de représenter en un minimum d’axes (dimensions) un jeu de données de manière à conserver un maximum d’inertie entre les individus. Les axes ainsi créés se nomment composantes principales.

Le but étant de synthétiser l’information et de mettre en lumière la structures des données.

Tout d’abord nous commençons par nous occuper des données manquantes. Il n’est pas possible de les supprimer car nous perdrions trop d’informations. C’est pourquoi nous choisissons de les imputer avec la commande imputePCA qui estime les valeurs manquantes à l’aide d’itérations d’ACP.

Inertie aux axes

Ce graphique représente les inerties cumulées pour chaque dimension. La cassure dans la courbe (le coude) est nette, on peut alors sélectionner ici les 3 ou 4 premiers axes, qui explique 51.4% de la variance.

Nuage des variables sur l’axe 1 et 2

Nous observons tout d’abord des effets taille sur l’axe 1 et 2 : les variables se rassemble en formant un cône sur chaque axe. La corrélation des variables est ainsi positive aux axes.

Tableau regroupant inerties, contributions et qualités de représentation à l’axe 1 et 2

Axe 1

Rock_n_Roll est très proche de l’axe 1 (le cos² sur l’axe 1 est grand) et éloigné du barycentre (proche du cercle de corrélation) donc Rock_n_Roll est très bien représenté sur l’axe 1 et sa contribution doit être bonne.

Les principales variables contribuant à l’axe 1 avec une bonne qualité de représentation sont :

  • Rock_n_Roll
  • Classique
  • Swing-Jazz
  • Rock
  • Alternative
  • Opera
  • Metal Hard_Rock

Axe 2

Dans le même esprit, l’axe 2 forme un effet taille avec des variables bien représentées et contribuant bien à l’axe.

Les principales variables contribuant à l’axe 2 avec une bonne qualité de représentation sont :

  • Dance
  • Latino
  • Pop
  • HipHop_Rap
  • Instrumental

Interprétation

En vu de la construction des axes, le premier plan semble distinguer les musiques de type “récente”, peut-être plus appréciés par une population jeune, et une musique plus “ancienne” avec pour chaque style une histoire, des valeurs, regroupant des passionnés.

Afin de vérifier notre hypothèse nous allons étudier le nuage des individus.

Nuage des individus distingués selon leur appréciation du Rock_n_Roll sur l’axe 1 et 2

Voici le nuage des individus. Chaque individu est colorié selon son appréciation à la musique Rock_n_Roll de 1 à 5.

Nous avons placé des ellipses qui se centrent selon la Distance euclidienne au barycentre.

On remarque bien ici que l’échelle d’appréciation est répartie tout au long de l’axe 1. À gauche, nous retrouvons des individus qui n’aime pas le Rock_n_Roll et à droite ceux qui l’apprécie. Quant au barycentre, on y retrouve les individus qui sont plutôt indifférents.

Nuage des individus distingués par leur appréciation à la Dance sur l’axe 1 et 2

Même réflexion pour l’axe 2, on retrouve bien ces niveaux d’appréciation tout au long de l’axe allant de n’aime pas (en bas) à adore (en haut).

Nuage des individus distingués par leur appréciation à la musique en général sur l’axe 1 et 2

L’idée ici est de déterminer quels sont les individus qui se situent dans le quart gauche inférieur. De manière logique, on peut imaginer un axe fictif à la diagonale de l’axe 1 et 2 (d’en bas à gauche à en haut à droite) stipulant l’appréciation à la musique. Nous remarquons que de manière général les individus adorent la musique. (l’ellipse pour la note de 5 construite à partir des distances moyennes au barycentre est superposée au profil moyen).

En quelque sorte, les personnes qui apprécient les deux styles de musiques que nous avons différenciés en axe 1 et 2 se retrouvent dans le quart droit supérieur du nuage des individus, on tend à penser qu’ils apprécient plus la musique de manière générale et sont donc ouvert à tous styles de musiques.

Un moyen de vérifier cette interprétation de l’étude est de faire une classification et d’en étudier les classes, que nous effectuerons plus loin.

Nous avons représenté ici le nuage des variables et des individus, nous avons pris soint de colorier les varaibles selon leur contribution à l’axe 1. Nous voyons bien que deux groupes de musiques se distinguent.

Axe 3 et 4

Nous nous intéressons maintenant au deuxième plan.

Axe 3

En regardant les contributions on remarque que les variables qui contribuent le plus à l’axe 3 sont :

  • Rythme (11,2%)
  • Reggea_ska (11%)
  • Punk (10,6%)
  • HipHop_Rap (10,3%)
  • Opera (8,77%)

On observe sur le nuage des variables que les 4 premières à contribuer à l’axe 3 s’opposent à Opera.

De manière générale, on observe sur l’axe 3 une opposition entre les musiques plus acoustique écoutées par une population plus attirée par les musiques douces avec des rythmes très variants et un emploi des instruments brut (Opera, Classique, Instrumental), et les musiques où le rythmes est très défini tout au long du morceau et où les sons des instruments sont assez travaillés et modifiés (Reggea_ska,HipHop_Rap,Punk).

Axe 4

Les variables qui contribuent le plus à l’axe 4 sont :

  • Reggea_ska (21%)
  • Techno_Trance (16,4%)
  • Swing_Jazz (7%)
  • Opera (5,7%)

On voit sur le nuage des variables que Reggea_ska et Swing_Jazz sont opposés sur l’axe 4 à Techno_Trance et Rythme. Ici l’axe 4 oppose clairement les musiques avec un rythme lent et un rythme rapide. On s’attend à ce que la contribution de la variable Rythme soit la plus forte sur ce plan puisqu’elle semble diriger notre interprétation des axes.

Contribution des variables au plan

Reggea_Ska 32.089883
Rythme 27.258004
Techno_Trance 24.153370
Opera 14.506449
Hiphop_Rap 13.697404
Punk 10.667943
Classique 9.993544
Dance 9.978619
Musique 8.833331
Metal_Hardrock 8.824404
Folk 7.681440
Swing_Jazz 7.158128
Rock 6.595727
Rock_n_Roll 4.477265
Latino 4.374054
Instrumental 3.737298
Alternative 2.509186
Country 2.198056
Pop 1.265895

On observe que les deux variables qui contribuent le plus au plan sont Reggea_ska, réputé pour la lenteur du rythme, et Rythme, qui nous le rappelons lesquelles s’opposent sur l’axe 4. L’axe 4 représente une échelle de rythme allant de lent à rapide.

Conclusion

Tout d’abord, le premier plan de l’ACP distingue deux styles de musiques : un plus apprécié par les jeunes (axe 2) et une autre regroupant de nombreux passionnés qui sont des musiques plus anciennes, historiques(axe 1).

  • Axe 1 : échelle d’appréciation pour les musiques historiques, moins récentes.
  • Axe 2 : échelle d’appréciation pour des musiques récentes, avec moins d’histoires, voir même à effets de mode.

Concernant le deuxième plan, celui-ce caractérise le rythme et la construction des musiques.

  • Axe 3 : oppose les musiques acoustiques, assez brutes instrumentalisent et plutôt douces, aux musiques dont les sons sont très travaillés, modifiés, voir de synthèses.
  • Axe 4 : échelle rythmique allant de lent à rapide.

Classification de l’ACP

Par les K-means

Tout d’abord, on détermine le nombre de partition optimale à l’aide de la fonction clusGap, qui nous donne la valeur optimale de classe à l’aide du gap statistic, qui trouve le nombre maximisant l’écart dans la variance intra-groupes en introduisant un nouveau centroïde pour plusieurs itérations.

On voit sur ce graphiques que le nombre optimal de classe calculé est 3. Ainsi, on précise dans la fonction des kmeans que l’on désire 3 clusters. De plus, on utilise ici la méthode Forgy qui définit les 3 premiers centres de façon aléatoire, et on répète l’algorithme 50 fois pour obtenir un meilleur partitionnement.

Ici donc les 3 clusters que les K-means nous ont donné.

Ceux-ci expliquent 21.968% de l’inertie.

On peut observer que le découpage en 3 classes confirme l’analyse en ACP à savoir :

  • Classe 1 : Population ayant une préférence pour les musiques “anciennes”.
  • Classe 2 : Population ayant une préférence pour les musiques “récentes”.
  • Classe 3 : Population étant plutôt indifférent aux styles de musique mais l’appréciant dans se généralité ou ne l’aimant pas (proportiton faible vu en ACP).

Par la CAH

Nous allons effectuer une classification ascendante hiérarchique (méthode de WARD) à partir des résultat de l’ACP.

Ci-dessus, on présente le dendogramme correspondant à cette classification. On a laissé R choisir automatiquement le nombre de classes, et il en dégage 3 groupes, tout comme la méthode des K-means. De plus, on précise que notre CAH a été consolidé par les k-means, et nous donne un gain d’inertie de 0.62103%.

Enfin, le graphique représentant les classes générées par la CAH. Nous remarquons que le découpage des clusters n’est pas tout à fait le même qu’avec les K-means. Nous allons étudier les clusters ci-dessous grâce aux tableaux des statistiques.

Description de la classe 1 de la CAH

v.test Mean in category Overall mean sd in category Overall sd p.value
Hiphop_Rap 7.945280 3.369723 2.910306 1.3316248 1.3728104 0.0000000
Dance 5.418794 3.381435 3.114730 1.1051294 1.1685331 0.0000001
Pop 4.636571 3.697995 3.471625 1.1443945 1.1591359 0.0000035
Techno_Trance 3.849122 2.554519 2.340555 1.3596652 1.3197479 0.0001185
Rythme 2.218801 3.406077 3.328252 0.8528578 0.8327547 0.0265002
Musique -3.402753 4.636766 4.731758 0.7892210 0.6627752 0.0006671
Latino -5.470367 2.537769 2.842494 1.2912527 1.3225261 0.0000000
Reggea_Ska -7.598180 2.382770 2.770042 1.1261899 1.2100922 0.0000000
Country -8.936310 1.720305 2.124315 0.7772956 1.0733613 0.0000000
Instrumental -10.567920 2.200608 2.761273 1.0701581 1.2595830 0.0000000
Folk -10.581316 1.780497 2.286814 0.9190099 1.1360433 0.0000000
Punk -13.241805 1.731485 2.455017 0.9869598 1.2972484 0.0000000
Opera -13.279335 1.477901 2.139547 0.7622357 1.1829378 0.0000000
Metal_Hardrock -14.075333 1.548915 2.361493 0.8562846 1.3706250 0.0000000
Swing_Jazz -15.057651 1.963406 2.759574 0.9706065 1.2553355 0.0000000
Alternative -15.129739 1.971220 2.827030 1.0188848 1.3429457 0.0000000
Classique -15.735485 2.129834 2.956806 0.9760924 1.2477370 0.0000000
Rock -16.607513 2.932772 3.759506 1.1376626 1.1818801 0.0000000
Rock_n_Roll -17.505956 2.229246 3.139433 0.9726098 1.2344045 0.0000000

Ci-dessus, le tableau montrant les statistiques des variables dans le cluster 1. Ce tableau nous permet de comparer la moyenne dans le cluster à la moyenne générale pour chaque variables.

Le cluster 1, d’après son positionnement sur le premier plan de l’ACP et les statistiques, regroupe les personnes appréciant les musiques “récentes” et aimant moins les musiques “anciennes”. On observe en effet dans la tableau que la moyenne d’appréciation dans la classe pour les variables Hip-Hop/Rap, Dance et Pop est beaucoup plus importantes que la moyenne général. De plus, c’est l’inverse que l’on observe avec des moyennes beaucoup plus faibles qu’en général sur les variables Rock_n_Roll, Rock et Classique.

Cela confirme l’interprétation que nous avions faite en ACP.

Description de la classe 2

v.test Mean in category Overall mean sd in category Overall sd p.value
Latino 14.889462 3.693780 2.842494 1.092920 1.322526 0.0000000
Instrumental 14.720743 3.562857 2.761273 1.126457 1.259583 0.0000000
Opera 13.585240 2.834286 2.139547 1.202840 1.182938 0.0000000
Folk 12.892709 2.920000 2.286814 1.143628 1.136043 0.0000000
Swing_Jazz 12.748599 3.451429 2.759574 1.083215 1.255335 0.0000000
Classique 12.726845 3.643299 2.956806 1.085253 1.247737 0.0000000
Country 10.867095 2.628571 2.124315 1.173169 1.073361 0.0000000
Dance 8.746344 3.556564 3.114730 1.034020 1.168533 0.0000000
Rock_n_Roll 8.518080 3.593994 3.139433 1.030847 1.234404 0.0000000
Pop 7.579354 3.851429 3.471625 1.003244 1.159136 0.0000000
Reggea_Ska 6.464794 3.108235 2.770042 1.139097 1.210092 0.0000000
Techno_Trance 4.867606 2.618270 2.340555 1.325281 1.319748 0.0000011
Hiphop_Rap 3.581467 3.122857 2.910306 1.298039 1.372810 0.0003417
Rock 2.100442 3.866825 3.759506 1.000254 1.181880 0.0356900
Punk -2.450520 2.317589 2.455017 1.103458 1.297248 0.0142650
Metal_Hardrock -3.429446 2.158288 2.361493 1.119347 1.370625 0.0006048

Concernant le cluster 2, en appliquant la même méthode, hormis quelques variables (Latino et Instrumentale) les moyennes du cluster sont très similaires aux moyennes générales. Nous retrouvons bien nos individus qui apprécient la musique de manière générale.

Description de la classe 3

v.test Mean in category Overall mean sd in category Overall sd p.value
Metal_Hardrock 18.378023 3.587248 2.361493 1.2852174 1.3706250 0.0000000
Punk 16.480171 3.495347 2.455017 1.1618321 1.2972484 0.0000000
Rock 15.270536 4.637747 3.759506 0.6097619 1.1818801 0.0000000
Alternative 13.876194 3.733838 2.827030 1.1869847 1.3429457 0.0000000
Rock_n_Roll 9.518942 3.711218 3.139433 1.0914288 1.2344045 0.0000000
Classique 3.265862 3.155099 2.956806 1.1455621 1.2477370 0.0010913
Musique 2.653421 4.817335 4.731758 0.5438899 0.6627752 0.0079680
Swing_Jazz 2.530447 2.914151 2.759574 1.2093062 1.2553355 0.0113917
Folk -2.326617 2.158195 2.286814 1.0066027 1.1360433 0.0199856
Instrumental -4.248104 2.500893 2.761273 1.1363971 1.2595830 0.0000216
Techno_Trance -9.126148 1.754465 2.340555 1.0511533 1.3197479 0.0000000
Latino -9.784032 2.212831 2.842494 1.0673936 1.3225261 0.0000000
Hiphop_Rap -12.091125 2.102581 2.910306 1.1369206 1.3728104 0.0000000
Pop -12.783605 2.750561 3.471625 1.0144763 1.1591359 0.0000000
Dance -14.823740 2.271812 3.114730 0.9286333 1.1685331 0.0000000

Toujours avec le même raisonnement, le cluster 3, lui, va à l’inverse du cluster 1, et regroupe les individus préférant les musiques “anciennes” aux musiques “récentes”, similairement à ce que nous avions estimé durant l’ACP.

Conclusion générale

L’ACP et les différentes méthodes de classification nous montrent une séparation nette entre les groupes. L’inertie inter-groupes se résume principalement dans les goûts musicaux, et plus particulièrement par l’ouverture globale à la musique des individus. De plus, elle nous révèle que les principales différences entre les individus se résument à leur préférence en terme de style musical et ce qui les composent en terme de caractéristiques (rythme, instruments, travail sonore). La classification a permis d’appuyer notre hypothèse en rangeant les individus dans des groupes expliqués par les axes. Nous avons de plus choisi de ne pas représenter les clusters sur les axes 3 et 4, car les deux axes sont tirés fortement par le rythme, empêchant une différenciation claire des groupes.

AFC

Nous nous demandons si les groupes en ACP sont déterminés plus précisément par une caractéristiques individuelles comme l’âge ou l’éducation par exemple.

AFC sur la musique classique et l’éducation.

Déteste N’aime Pas Indifférent Apprécie Adore
Licence 34 52 55 31 40
Primaire 18 30 18 11 12
Doctorat 0 0 2 3 0
Master 5 16 23 25 12
Collège/Lycée 81 151 183 118 82

Ici est présenté le tableau de contingence qui croise les variables Education et les modalités de la variable concernant la musique Classique.

Nous avons renommé les modalités de 1 à 5 en niveaux d’appréciation classiquement utilisés dans les enquêtes.

Test du khi²

On effectue tout d’abord un test du Chi² pour vérifier la pertinence d’effectuer une AFC ici. Le test nous retourne une p-value de 0.0042805. On peut alors rejeter l’hypothèse d’indépendance. Cependant, on obtient un avertissement concernant les valeurs et qu’ainsi l’approximation peut être incorrecte.

On peut utiliser simulate.p.value = TRUE pour simuler des valeurs de p-value par itération et appuyer notre premier résultat.

La p-value est de 0.003998. On rejette donc toujours l’hypothèse d’indépendance.

On peut donc effectuer l’AFC.

Inertie aux axes

On remarque que l’information totale est résumée en 4 axes, ce qui est peu étonnant au vu de la faible quantité de cellules de notre tableau de contingence (5 profils colonnes, 5 profils lignes).

Le premier axe conserve à lui seul 80,5% d’inertie, cela signifie que 80,5% de la distance au Khi² est expliqué par le premier axe. Nous avons également 11,80% d’inertie au second ce qui nous donne une inertie au premier plan factoriel de 92,3%.

Nous nous limiterons à interpréter l’AFC sur ces deux axes.

Regardons les profils lignes

De manière générale :

  • La catégorie Doctorat est très éloignée du profil moyen, elle semble être aussi bien représentée sur l’axe 1 que sur l’axe 2. Nous avons essayé de ré-effectuer cette AFC en mettant Doctoraten variable supplémentaire, mais cela ne changeait pas grand-chose.

  • Il semble que l’axe 2 soit tiré par les individus de la catégorie Licence.

  • La catégorie Collège/Lycée est proche du barycentre, donc est proche de l’individu moyen théorique dans la manière d’apprécier la musique classique.

Observons les contribution et les qualités de représentation des lignes aux axes

Pour les contributions, on peut voir dans ce tableau que Master, Primaire et Doctorat contribue au Khi² sur l’axe 1 à hauteur d’environ 85% Pour l’axe 2, son inertie est en grande partie expliquée par le profil ligne Licence à hauteur de 55,5% et Primaire y contribue également à hauteur de 26,34%

Quant aux qualités de représentation, Doctorat est effectivement très bien représenté sur l’axe 1 mais il faut s’en méfier car cette catégorie comprend peu d’individus. De plus, nous voyons que globalement les profils lignes sont bien représentés sur l’axe 1 avec une bien meilleure qualité pour Master et Primaire.

Pour l’axe 2, c’est un peu différent, les qualités sont bien plus faibles. Tout porte à penser que l’axe 1 représente le niveau d’étude. On précisera tout de même que Licence et Collège sont mieux représenté sur l’axe 2 que les autres catégories.

Regardons les contibutions des profils lignes au premier plan factoriel

Contribution au premier plan
Licence 67.70171
Primaire 53.41409
Master 38.99637
Doctorat 28.26690
Collège/Lycée 11.62092

Nous remarquons que l’inertie total du premier plan factoriel provient en grande partie de Licence et Primaire.

Regardons les profils colonnes

Le nuage des profils colonnes est intéressant par sa structure, on voit bien que les mesure d’appréciation s’étendent le long de l’axe 1 allant de Apprécie à Déteste. Par ailleurs, ces deux catégories sont très opposées, on s’attend à ce qu’elles contribuent fortement à l’axe 1.

Chose plus étonnante Adore se détache et semble être plus représentée sur l’axe 2.

Observons les contribution aux axes

Comme nous l’avions pressenti, la contribution de Apprécie est forte à hauteur de 50,73% et Déteste à hauteur de 26,19%.

Les autres modalités contribuent beaucoup moins.

Comme observé, la contribution de la modalité Adore à l’axe 2 est très importante : 77,2%. A l’opposé, on a la modalité N'aime pas qui y contribue à hauteur de 19%.

Pour les représentations, Apprécie est très bien représenté sur l’axe 1 à ’l’instar de Déteste et N'aime pas. Pour l’axe 2, les qualités de représentation sont plutôt médiocres, hormis pour Adore avec 76%

Conclusion

On remarque que le profil Collège/lycée est assez proche du profil moyen avec un goût pour le classique plutôt neutre. Les étudiants en Licence quant à eux semblent se détacher de la même manière que la modalité Adore. Les Primaires semblent ne pas vraiment apprécier la musique classique. En Master, l’avis semblent de manière général tendre vers Apprécie.

Ainsi, on peut supposer que l’appréciation au classique est plus forte chez les étudiants en étude supérieur (licence et plus). A considérer que Doctorat est mal représenté dans la population et ne définit donc pas une généralité concernant ce niveau d’étude. De plus, il est important de rappeler que, globalement, le niveau d’étude est fortement corrélé avec l’âge, et que celui-ci doit aussi avoir son influence.

AFC sur l’âge et le hip-hop/rap

Maintenant, nous allons nous intéresser au lien entre l’âge des individus répartis en classe et le style Hip-Hop/Rap. Après de nombreux essais concernant la séparation des classes d’âge, nous avons décider de garder 3 classes d’âge découpé en 5 années chacune. On rappelle que la population étudiée s’étale de 15 à 30 ans. Nous avons remarqué que de multiples classes homogénéisait la population et ne permettait pas de faire ressortir l’inertie inter-groupes. On s’attend donc à une AFC qui exprime l’inertie en très peu d’axes.

Tableau de contingence

Déteste N’aime Pas Indifférent Apprécie Adore
Entre 15 et 20 ans 121 128 131 148 89
Entre 20 et 25 ans 64 68 61 65 57
Entre 25 et 30 ans 26 10 11 10 10

Test du chi-deux

Comme pour l’AFC précédente, on effectue un test du Khi² pour vérifier que notre AFC est valable. Ici, la p-value est de 0.0260941, on rejette alors l’hypothèse d’indépendance et on peut valider notre AFC.

Inerties aux axes

eigenvalue percentage of variance cumulative percentage of variance
dim 1 0.0144724 83.03441 83.03441
dim 2 0.0029570 16.96559 100.00000

On remarque que l’information totale est résumée en 2 axes, ce qui est peu étonnant au vu de la faible quantités de cellules de notre tableau de contingence (5 profils colonnes, 3 profils lignes).

Le premier axe conserve à lui seul 83%d’inertie, cela signifie que 83% de la distance au Khi² est expliquée par ce dernier. Nous avons également 17% d’inertie au second axe. Soit comme nous l’avions pensé, l’inertie se résume en très peu d’axes, ici deux.

Le diagramme des inerties confirme notre analyse.

Regardons les profils lignes

Nous voyons que les profils lignes s’éloignent du profil moyen de manière disjointe. Effectivement, la catégorie [20-25] semble contribuer de manière très forte à l’axe 2. Contrairement aux catégories [15-20] et [25-30] qui s’opposent sur l’axe 1.

On s’attend donc à ce que l’axe 1 soit formé par les catégories [15-20] et [25-30] Et que l’axe 2 soit formé en grande partie par l’inertie du profil ligne [20-25].

Observons les contribution et les qualités de représentations des profils lignes aux axes

On peut voir que les catégories [25-30] et [15-20] contribue à l’axe 1 pour plus de 99.9%. On remarque bien évidement que la classe [20-25] ne contribue pas du tout à l’axe 1.

L’axe 2 trouve son inertie en grande partie par le profil ligne [20-25] à hauteur de 68,5% et la modalité [15-20] y contribue également à hauteur de 28.5%.

Pour les qualités de représentation, on s’attendait à ce que la classe [20-25] soit très mal représentée sur l’axe 1. Cependant comme prévu, les qualités de représentation des modalités [25-30] et [15-20] sont très bien élevées sur l’axe 1.

Quant à l’axe 2, nous avions remarqué que la classe [20-25] était bien représentée sur l’axe 2 et était très éloignée du profil moyen. De ce fait, la qualité de représentation étant le carré de sa coordonnée, elle est très importante.

Regardons les contibutions des profils lignes au premier plan factorielle

x
Entre 25 et 30 ans 93.29329
Entre 20 et 25 ans 68.46847
Entre 15 et 20 ans 38.23824

Nous remarquons que l’inertie totale du premier plan factoriel provient en grande partie des classes [25-30] et [20-25] qui nous le rappelons expliquent chacune un axe distinct.

Regardons le nuage de profils colonnes

Le nuage des profils colonnes se distingue principalement le long des axes, en regardant quels profils colonnes sont proches d’un axe et éloignés du profil moyen, on peut remarquer que l’axe 1 est plutôt porté sur le fait d’aimer ou non le Hip-Hop (de gauche à droite sur l’axe 1 pour les modalités Apprécie et Déteste).

On voit que le profil Déteste semble tiré l’axe 1, il doit beaucoup contribuer.

Inversement avec l’axe 2, qui semble trouver son inertie avec la modalité Adore et peut-être Apprécie. Cela ne sont cependant que des hypothèses à vérifier par la suite.

Qualités de représentations et contributions aux axes des profils colonnes

Comme nous l’avions pressenti, la contribution pour l’axe 1 de Déteste est forte à hauteur de 73% et Apprécie à hauteur de 15.3%. Ainsi, l’hypothèse que nous avions faite au départ semble se confirmer concernant la signification de l’axe 1. Les autres modalités sont bien moins représentées.

Pour l’axe 2, comme observé, la contribution à l’inertie de la modalité Adore est très importante avec 61,3%. Le profil colonne Apprécie contribue à la distance au Khi² à hauteur de 20%. On note d’ailleurs que ce profil contribue aux deux axes dans des proportions assez proches.

Quand aux représentation, sur l’axe 1 le profil Déteste est très bien représenté avec une valeur de 0.987, ainsi que N'aime pas avec 0.827 et aussi, Apprécie et Indifférent avec environ 0.77 chacun. Sur l’axe 2, les qualités de représentation sont plutôt médiocres hormis pour Adore avec 0.99.

Conclusion

Globalement, les individus entre 15 et 20 ans apprécie plutôt le Hip-Hop/Rap (qualité de représentation plus élevée que Indifférent). Pour les individus entre 25 et 30 ans, il semblerait que ceux-ci déteste globalement ce style. Et enfin, que ce style soit adoré chez les 20/25 ans. On remarque donc comme la précédente AFC, un lien certain antre l’âge et l’appréciation de certains styles musicaux. On peut penser que cela s’explique par les années dans lesquelles sont nées ces individus. En effet, l’étude ayant été fait en 2013, montre que chaque groupe est né et a grandi dans des ères musicales différents.

ACM

Nous allons maintenant effectuer une ACM avec les variables suivantes:

  • Toutes les types de musiques en facteur cette fois.
  • Le genre.
  • L’éducation.
  • L’âge en classe similairement à l’AFC.

Similairement à l’ACP, nous avons d’abord imputer la base de données à l’aide de la fonction imputeMCA qui estime les valeurs manquantes par une itération d’ACM.

Suite à des différents essais de choix de variables pour l’ACM nous donnant des inerties peu différenciées en axes (pas de cassure), nous avons décidé de conserver les styles de musiques les plus représentatif des clusters dans l’ACP. Effectivement, un gain d’inertie sur les premiers axes est ressenti, et une différenciation drastique des inerties aux dimensions plus lointaines.

Diagrammes des inerties relatives aux axes et choix des dimensions

Ce premier graphique représente les inerties pour chaque axes factoriels.

On peut alors sélectionner ici les 3/4 premiers axes, qui explique 23.6% de l’inertie Nous aviserons évidemment en fonction du nombre d’axes que nous arriverons à interpréter.

Représentation des variables, contributions et qualités

Nous allons d’abord ici regarder la répartition des modalités sur les axes, puis leur contribution et leur qualités.

Nuage des variables

On remarque plusieurs choses sur ces graphiques.

Tout d’abord, on peut supposer que l’axe 1 est déterminé par les niveaux d’appréciation, en effet, les valeurs s’étalent de 1 à 5 en allant de gauche à droite.

Quant à l’axe 2, on peut supposer au vu des contributions ci-dessous que celui-ci est dirigé par l’instrumentalisation et les sonorités utilisées dans les musiques, de sonorités naturelles, pures à des sonorités plus artificielles, voir électroniques.

De plus, il est important de noter un effet Guttman au vu de la dispersion des modalités sur les axes 1 et 2. En effet, il doit y avoir un jeu d’interactions entre les deux axes formant ce U assez distinct sur le graphique. Ce problème est favorisé lorsque l’analyse porte sur des variables avec un nombre impair de modalités, donc avec une modalité médiane : c’est le cas des échelles de 0 à 5 où la modalité 3 est médiane

Contribution

Pour l’axe 1, les variables qui contribuent le plus sont celles que nous avons dit plus haut à savoir le Classique_1, le Swing_jazz_1, l’Instrumental_1 et aussi le Opera_1 et pour toutes avec la modalité 1. Cela appuie notre hypothèse de l’axe définit par les appréciations.

Pour l’axe 2, les variables qui contribuent le plus sont la Classique_5, le Opera_5, le Hip-Hop/rap_1 et Dance_1. On voit bien une opposition d’appréciation entre le côté naturel ou non des sonorités utilisées.

Qualité de représentation

Pour la qualité de représentation, on retrouve semblablement les mêmes conclusions que pour la contributions aux axes. Les variables les plus éloignées du barycentre vont avoir une meilleure qualité de représentation et sont les mêmes contribuant aux axes.

Représentation des individus, qualité et représentation

Passons maintenant à la représentation des individus dans l’espace pour voir la répartition des individus sur les axes.

La répartition des individus semblent suivre les modalités. on peut sortir certains individus et les valeurs qu’ils prennent dans ces modalités pour se donner une idée des axes.

Dance Pop Hiphop_Rap Classique Swing_Jazz Rock_n_Roll Instrumental Latino Opera Genre Education Age_cat
771 1 1 1 1 1 1 1 1 1 Femme Licence Entre 15 et 20 ans
547 3 4 2 5 5 5 5 5 5 Homme Master Entre 25 et 30 ans
825 1 3 1 5 2 5 1 2 5 Femme Licence Entre 25 et 30 ans
449 4 4 4 2 2 4 2 2 2 Femme Collège/Lycée Entre 15 et 20 ans

Le tableau ci-dessus met en valeurs 4 individus, chacun représentant une extrémité d’un axe auquel chacun contribue grâce au graphique précédent :

  • 762 : Gauche axe 1
  • 389 : Droite axe 1
  • 825 : Haut axe 2
  • 251 : Bas axe 2

Les valeurs qu’ils prennent tendent à confirmer notre interprétation des axes 1 et 2.

Conclusion pour les deux premiers axes

Au vu des variables qualitatives et des valeurs prises par les individus contribuant le plus. On tend à confirmer nos hypothèses concernant les axes 1 et 2 :

  • Axes 1 : Appréciation générale de la musique.
  • Axes 2 : Appréciation du type de sonorité de la musique (artificielle en bas, naturelle en haut).

Nous avons tenter d’interpréter les axes 3 et 4, mais ils n’en ressortaient aucune informations claires. Nos deux axes expliquent donc 11% de l’inertie.

Classification

Nous allons effectuer une classification ascendante hiérarchique à partir de l’ACM vu précédemment, et essayer d’identifier des groupes d’individu.

Le dendogramme ci-dessus nous montre la répartition des individus en 3 groupes. Le choix de ce nombre a été fait automatiquement par R et semble après d’autres essais être le plus convaincant.

Ce graphique montre la répartition des clusters sur les dimensions 1 et 2.

Variables du cluster 1

Ce tableau nous montre quelle modalité caractérise au mieux une classe en comparant la proportion de cette modalité dans la classe et la proportion de cette modalité dans la population globale.

Cla/Mod Mod/Cla Global p.value v.test
Swing_Jazz=Swing_Jazz_1 80.097087 59.7826087 20.396040 0.0000000 18.214417
Opera=Opera_1 57.435897 81.1594203 38.613861 0.0000000 17.145647
Classique=Classique_1 86.956522 43.4782609 13.663366 0.0000000 16.020119
Instrumental=Instrumental_1 72.081218 51.4492754 19.504950 0.0000000 14.912357
Latino=Latino_1 69.270833 48.1884058 19.009901 0.0000000 13.731477
Rock_n_Roll=Rock_n_Roll_1 78.632479 33.3333333 11.584158 0.0000000 12.391096
Dance=Dance_1 61.702128 21.0144928 9.306931 0.0000000 7.333755
Pop=Pop_1 68.333333 14.8550725 5.940594 0.0000000 6.799542
Rock_n_Roll=Rock_n_Roll_2 43.523316 30.4347826 19.108911 0.0000001 5.413223
Genre=Homme 33.495146 50.0000000 40.792079 0.0002883 3.625635
Hiphop_Rap=Hiphop_Rap_1 35.981308 27.8985507 21.188119 0.0017348 3.132237
Hiphop_Rap=Hiphop_Rap_5 37.341772 21.3768116 15.643564 0.0027560 2.993723
Education=Primaire 37.777778 12.3188406 8.910891 0.0237848 2.260588
Hiphop_Rap=Hiphop_Rap_2 21.739130 16.3043478 20.495050 0.0410848 -2.042673
Hiphop_Rap=Hiphop_Rap_4 21.333333 17.3913043 22.277228 0.0206389 -2.314526
Classique=Classique_3 20.350877 21.0144928 28.217822 0.0015580 -3.163658
Pop=Pop_4 20.569620 23.5507246 31.287129 0.0009936 -3.292336
Latino=Latino_3 19.166667 16.6666667 23.762376 0.0009189 -3.314258
Dance=Dance_3 20.061728 23.5507246 32.079208 0.0003063 -3.609889
Genre=Femme 23.076923 50.0000000 59.207921 0.0002883 -3.625635
Rock_n_Roll=Rock_n_Roll_5 15.568862 9.4202899 16.534654 0.0001052 -3.878386
Opera=Opera_5 3.773585 0.7246377 5.247525 0.0000071 -4.490854
Latino=Latino_5 10.526316 5.7971014 15.049505 0.0000001 -5.407068
Rock_n_Roll=Rock_n_Roll_3 15.894040 17.3913043 29.900990 0.0000000 -5.488035
Opera=Opera_4 6.122449 2.1739130 9.702970 0.0000000 -5.523931
Swing_Jazz=Swing_Jazz_5 6.000000 2.1739130 9.900990 0.0000000 -5.625811
Instrumental=Instrumental_4 9.638554 5.7971014 16.435644 0.0000000 -6.032573
Instrumental=Instrumental_3 14.134276 14.4927536 28.019802 0.0000000 -6.106174
Classique=Classique_5 8.108108 4.3478261 14.653465 0.0000000 -6.205193
Swing_Jazz=Swing_Jazz_3 13.186813 13.0434783 27.029703 0.0000000 -6.419613
Rock_n_Roll=Rock_n_Roll_4 11.255411 9.4202899 22.871287 0.0000000 -6.623829
Instrumental=Instrumental_5 4.310345 1.8115942 11.485148 0.0000000 -6.723973
Opera=Opera_3 6.857143 4.3478261 17.326733 0.0000000 -7.367565
Classique=Classique_4 7.407407 5.0724638 18.712871 0.0000000 -7.467645
Swing_Jazz=Swing_Jazz_4 7.035176 5.0724638 19.702970 0.0000000 -7.871225
Opera=Opera_2 10.884354 11.5942029 29.108911 0.0000000 -7.941478
Latino=Latino_4 5.232558 3.2608696 17.029703 0.0000000 -7.999356

Le cluster 1 est celui regroupant le plus de personnes prenant des modalités 1 pour beaucoup de styles de musiques, voir tous. Ce sont principalement les gens n’aimant vraiment pas un style ou plusieurs. Le cluster se situe à gauche sur l’axe 1 de l’ACM, cela tend à renforcer notre interprétation de celui-ci.

Variables du cluster 2

Cla/Mod Mod/Cla Global p.value v.test
Opera=Opera_2 80.272109 43.1444241 29.1089109 0.0000000 10.966475
Classique=Classique_3 75.789474 39.4881170 28.2178218 0.0000000 8.811563
Instrumental=Instrumental_3 75.265018 38.9396709 28.0198020 0.0000000 8.548463
Rock_n_Roll=Rock_n_Roll_3 74.172185 40.9506399 29.9009901 0.0000000 8.466254
Swing_Jazz=Swing_Jazz_3 73.992674 36.9287020 27.0297030 0.0000000 7.821167
Pop=Pop_4 68.670886 39.6709324 31.2871287 0.0000000 6.293857
Dance=Dance_3 68.209876 40.4021938 32.0792079 0.0000000 6.202596
Latino=Latino_4 75.000000 23.5831810 17.0297030 0.0000000 6.138003
Swing_Jazz=Swing_Jazz_2 71.120690 30.1645338 22.9702970 0.0000000 5.978407
Opera=Opera_3 71.428571 22.8519196 17.3267327 0.0000003 5.107202
Classique=Classique_4 68.783069 23.7659963 18.7128713 0.0000063 4.514885
Classique=Classique_2 66.400000 30.3473492 24.7524752 0.0000067 4.503568
Latino=Latino_3 66.666667 29.2504570 23.7623762 0.0000074 4.480857
Dance=Dance_4 66.525424 28.7020110 23.3663366 0.0000118 4.381175
Hiphop_Rap=Hiphop_Rap_4 66.222222 27.2394881 22.2772277 0.0000344 4.142304
Rock_n_Roll=Rock_n_Roll_4 65.800866 27.7879342 22.8712871 0.0000482 4.064198
Instrumental=Instrumental_4 66.867470 20.2925046 16.4356436 0.0002981 3.616932
Instrumental=Instrumental_2 62.500000 28.3363803 24.5544554 0.0023602 3.040710
Hiphop_Rap=Hiphop_Rap_2 61.835749 23.4003656 20.4950495 0.0128231 2.488645
Latino=Latino_2 60.629921 28.1535649 25.1485149 0.0167044 2.393150
Education=Doctorat 100.000000 0.9140768 0.4950495 0.0462035 1.993530
Pop=Pop_2 45.806452 12.9798903 15.3465347 0.0240554 -2.256244
Opera=Opera_4 41.836735 7.4954296 9.7029703 0.0105134 -2.558469
Latino=Latino_5 42.763158 11.8829982 15.0495050 0.0023400 -3.043296
Swing_Jazz=Swing_Jazz_5 38.000000 6.9469835 9.9009901 0.0006805 -3.397320
Dance=Dance_5 37.588653 9.6892139 13.9603960 0.0000223 -4.240667
Rock_n_Roll=Rock_n_Roll_5 34.131737 10.4204753 16.5346535 0.0000000 -5.678629
Hiphop_Rap=Hiphop_Rap_1 33.644860 13.1627057 21.1881188 0.0000000 -6.784787
Instrumental=Instrumental_5 23.275862 4.9360146 11.4851485 0.0000000 -7.164462
Pop=Pop_1 6.666667 0.7312614 5.9405941 0.0000000 -8.037016
Opera=Opera_5 1.886793 0.1828154 5.2475248 0.0000000 -8.529835
Opera=Opera_1 36.923077 26.3254113 38.6138614 0.0000000 -8.737289
Dance=Dance_1 10.638298 1.8281536 9.3069307 0.0000000 -9.255664
Rock_n_Roll=Rock_n_Roll_1 11.965812 2.5594150 11.5841584 0.0000000 -10.098516
Latino=Latino_1 20.312500 7.1297989 19.0099010 0.0000000 -10.628962
Instrumental=Instrumental_1 20.812183 7.4954296 19.5049505 0.0000000 -10.631101
Classique=Classique_5 14.189189 3.8391225 14.6534653 0.0000000 -10.881097
Classique=Classique_1 10.144927 2.5594150 13.6633663 0.0000000 -11.652078
Swing_Jazz=Swing_Jazz_1 13.106796 4.9360146 20.3960396 0.0000000 -13.694055

Le cluster 2, lui regroupe les modalités 3 et 4, ce sont des gens qui apprécient la musique en général, mais ont aussi une tendance à préférer légèrement les musiques au sonorités modernes, travaillés, artificielles avec des modalités légérement supérieure pour Popet Latino.

Variables du cluster 3

Cla/Mod Mod/Cla Global p.value v.test
Classique=Classique_5 77.702703 61.497326 14.653465 0.0000000 17.702343
Instrumental=Instrumental_5 72.413793 44.919786 11.485148 0.0000000 13.817015
Opera=Opera_5 94.339623 26.737968 5.247525 0.0000000 12.485303
Rock_n_Roll=Rock_n_Roll_5 50.299401 44.919786 16.534654 0.0000000 10.474277
Swing_Jazz=Swing_Jazz_5 56.000000 29.946524 9.900990 0.0000000 8.944162
Latino=Latino_5 46.710526 37.967914 15.049505 0.0000000 8.802203
Opera=Opera_4 52.040816 27.272727 9.702970 0.0000000 7.960679
Swing_Jazz=Swing_Jazz_4 35.175879 37.433155 19.702970 0.0000000 6.340116
Hiphop_Rap=Hiphop_Rap_1 30.373832 34.759358 21.188119 0.0000016 4.796921
Dance=Dance_5 34.042553 25.668449 13.960396 0.0000018 4.778409
Pop=Pop_5 28.310502 33.155080 21.683168 0.0000513 4.049495
Genre=Femme 21.739130 69.518717 59.207921 0.0013428 3.206670
Dance=Dance_1 27.659575 13.903743 9.306931 0.0221322 2.288091
Dance=Dance_2 23.720930 27.272727 21.287129 0.0303561 2.165412
Classique=Classique_4 23.809524 24.064171 18.712871 0.0423962 2.029610
Latino=Latino_3 14.166667 18.181818 23.762376 0.0441915 -2.012270
Hiphop_Rap=Hiphop_Rap_4 12.444444 14.973262 22.277228 0.0063546 -2.728902
Rock_n_Roll=Rock_n_Roll_1 9.401709 5.882353 11.584158 0.0044684 -2.843050
Swing_Jazz=Swing_Jazz_3 12.820513 18.716577 27.029703 0.0037504 -2.898423
Genre=Homme 13.834952 30.481283 40.792079 0.0013428 -3.206670
Latino=Latino_1 10.416667 10.695187 19.009901 0.0008011 -3.352425
Latino=Latino_2 11.023622 14.973262 25.148515 0.0002313 -3.682088
Dance=Dance_3 11.728395 20.320856 32.079208 0.0000896 -3.917250
Dance=Dance_4 10.169491 12.834225 23.366337 0.0000819 -3.938680
Instrumental=Instrumental_3 10.600707 16.042781 28.019802 0.0000276 -4.192583
Pop=Pop_4 10.759494 18.181818 31.287129 0.0000096 -4.426398
Rock_n_Roll=Rock_n_Roll_3 9.933775 16.042781 29.900990 0.0000018 -4.774789
Instrumental=Instrumental_1 7.106599 7.486631 19.504950 0.0000007 -4.957649
Instrumental=Instrumental_2 8.064516 10.695187 24.554455 0.0000002 -5.188017
Swing_Jazz=Swing_Jazz_1 6.796117 7.486631 20.396040 0.0000002 -5.251288
Opera=Opera_2 8.843537 13.903743 29.108911 0.0000001 -5.330204
Classique=Classique_1 2.898551 2.139037 13.663366 0.0000000 -5.855169
Rock_n_Roll=Rock_n_Roll_2 4.663212 4.812834 19.108911 0.0000000 -6.132986
Swing_Jazz=Swing_Jazz_2 5.172414 6.417112 22.970297 0.0000000 -6.560909
Classique=Classique_2 4.800000 6.417112 24.752475 0.0000000 -7.100899
Classique=Classique_3 3.859649 5.882353 28.217822 0.0000000 -8.357494
Opera=Opera_1 5.641026 11.764706 38.613861 0.0000000 -8.904655

Quant au cluster 3, ce sont les individus qui apprécient beaucoup les styles de musiques aux sonorités naturelles avec des modalité 5 pour la plupart des variables. De plus, le cluster se situent dans le coin supérieur droit du graphique, appuyant ainsi nos interprétations des axes.

Conlusion

Les clusters définit par la CAH tendent à confirmer les interprétations que nous avions faites des axes de l’ACM. De plus, les clusters s’intersectionnent au niveau du profil moyen, c’est à dire des notes moyennes, et aucune préférence pour un type de sonorité. Les individus qui sont à l’intersection des clusters 2 et 3, sont les individus qui apprécient beaucoup la musique en général sans distinction de sonorité, qui sont donc ouvert à tout.